PDF Extractor SDK Windows-ohjelmistokehittäjille: PDF-teksti, PDF XML, PDF-tiedostot, PDF-tiedoston lukeminen, PDF CSV Excel.
Bytescout PDF Extractor SDK mahdollistaa muuntaa PDF jotta kirjoitus, PDF XML, PDF CSV, poimia kuvia PDF, tietoonsa PDF-tiedostot .NET ja ActiveX rajapintoja ilman erillistä ohjelmistoa.
Edut:
muuntaa PDF-tekstin tavalliseksi tekstiksi (ja se voi seurata sarakkeita, jos muunat sanomalehteä PDF-muodossa) - mukaan lukien näkymätön tekstin poisto;
muuntaa taulukot PDF: ksi Exceliksi (CSV) lukemalla soluja tietystä suorakulmasta;
muuntaa taulukot PDF-muotoon XML-tiedostoihin;
otat PDF-tiedoston metatiedot (otsikko, tekijä, kuvaus) ja saavat muita tietoja tiedostosta (sivumäärä, salattu tai ei);
otat upotetut kuvat PDF-dokumentilta (ASP.NET, VB.NET, C #, VB6 ja VBScript);
DocumentMerger- ja DocumentSplitter-rajapinnat ja -luokat yhdistää ja jakaa PDF-dokumentteja;
ei edellytä Adobe Readerin tai muun PDF-lukijaohjelmiston asentamista;
tarjoaa .NET- ja ActiveX-rajapinnat;
tehty 100% onnistuneella C # -koodilla.
Uutta strong> tässä julkaisussa:
Versio 9.0.0.3079: Lisäsisällön suodattaminen fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.
Uutta strong> versiossa 8.7.0.2980:
Lisätyn sisällön suodatus fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.
Uutta strong> versiossa 8.6.0.2911:
Lisätyn sisällön suodatus fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.
Uutta strong> versiossa 8.2.0.2699:
Versio 8.2.0.2699 voi sisältää määrittelemättömiä päivityksiä, parannuksia tai virheenkorjauksia.
Uutta strong> versio 8.0.0.2528:
Uutta strong> versiossa 7.0.0.2474: Versio 7.0.0.2474:
Kiinteä bugi asentimessa, joka aiheutti joitain aiempaan asennukseen liittyviä tiedostoja, häiritsi päivityksiä
Uutta strong> version 6.30.0.2421:
Version 6.30.0.2421:
- Lisätty TextComparer-apuohjelma-luokka (saatavilla vain .NET 4.0-kokoonpanoissa), jonka avulla voidaan verrata tekstiä kahteen PDF-dokumenttiin ja luoda raportti.
- Parannettu ICC-väriprofiilien tuki.
- Sulautettujen kirjasimien liittäminen.
- Parannettu liiteExtractor.
- Kiinteä XMLExtractor.SaveXMLToStream () -menetelmä.
- Kiinteä kopioitu tekstinkopiointi käytettäessä OCRCacheMode.WholePage-vaihtoehtoa.
- Muut virheenkorjaukset ja parannukset.
Uutta strong> versiossa 6.20.2354:
Versio 6.20.2354:
- PDF Tekstiin, PDF-tiedostoon CSV, PDF XML-toimintoihin parannettu
- Uutta uutistoimintoa, Audio-esimerkkien poisto
- CSV- ja XML-poistoimijat paranivat taulukot, joissa on tyhjiä sarakkeita li>
- uusi MultimediaExtractor video- ja äänitiedostojen poistamiseen PDF-tiedostoista li>
- uusi ominaisuus PageDataCaching
- uusi "MemoryCareProcessingOfHugeFiles" esimerkki
- kiinteä nolla poikkeus yrittäessäsi luovuttaa jo luovutettuja sivuja
- XLSExtractor: parantaa fonttien tukea
- SkipInvisibleText ohittaa leikattua tekstiä (joka ei ole näkyvissä)
- tekstin tulosteiden esitys paranee
- XFDF Extractor: lisätään tukea valintaruuduille
- Kuvatuotos parani tukemaan useampia alimuotoja
- Unicode-tekstinkäsittely parani
Uutta strong> versio 6.11.2149:
Versio 6.11.2149:
- Eräajankäsittelynäytteet päivittyvät osoittamaan Reset () -menetelmän käyttöä
- C ++-lähdekoodin näyte lisätään Pages Extraction -ohjelmaan
- DocumentMerger lisää Merge2 (inputfile1, inputfile2, outputfile) -menetelmän yhdistämään 2 tiedostoa
- XLS Extractor pienet bugikorjaukset
- PDF Multitool mahdollistaa nyt tekstin, kuvan, vektorin kerrosten ottamisen / poistamisen käytöstä, lisää tekstiasetusten lisäasetuksia
- XML, CSV, taulukon poistaminen parantaa taulukkojen tukemista emtpry-solujen sisällä sarakkeissa
- .ExtractShadowLikeText-ominaisuus parantunut: paremman suodatuksen varjotyyppiseen tekstiin
Uutta strong> versio 6.10.2136:
Versio 6.10.2136:
- PDF XML: ään, PDF: hen CSV: lle, PDF: lle Tekstitoiminto parani
- PDF-tiedoston XLS-komentorivin lisäys (vbscriptin perusteella)
- PDF HTML SDK: ssa lisää uuden .DetectHyperLinks-ominaisuuden (TRUE oletusarvoisesti) automaattisten linkkien havaitsemiseen tekstissä
- uusi SearchablePDFMaker (saatavilla PRO-lisensseille) PDF muuntamiseen PDF-tiedostoiksi
- uusia ominaisuuksia liesituulettimissa: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders CFG-tiedostoissa
- otsikon sarakkeiden havaitseminen (kun AutoAlighHeaderToColumns = true) parannettu
- .DetectLinesInsteadOfParagraphs korvataan uudella .LineGroupingMode-menetelmällä, jolla hallitaan, miten rivit sulautuvat kappaleisiin
- TÄRKEÄÄ! PDF-tiedostoon XML korjaa pitkäaikaisen virhekoodin tekstikohteiden Y-koordinaatilla (osoitti vasemmalle vasemmalle vasemmalta ylhäällä)
- .TableXMinIntersectionRequiredInPercents ja .TableYMinIntersectionRequiredInPercents ominaisuudet lisätty
- Lisättiin C + + lähdekoodin näyte
- XML Extractor korjaa puuttuvat tyhjät sarakkeet PreserveFormatting = true-tilassa
- pienet korjaukset väreissä joissakin PDF-tiedostoissa
- tuki useille tekstintunnistuskoodille lisättyjä kieliä
- PDF Multitool GUI: Lisää Kopioi Leikepöydälle -painikkeeksi TXT-, CSV-, XML- ja rasterisoitinvalintaikkunat
- XLSExtractor: lisää PageToWorksheet -ominaisuuden ottamaan käyttöön / poistamaan käytöstä erilliset laskentataulukot sivua kohti
- uusi .TextEncodingCodePage-ominaisuus
- PDFViewerControl: lisää ValidateContextMenu-ohjelman, jonka avulla käyttäjä voi lisätä mukautettuja kohteita kontekstivalikkoon
- PDF Viewer -ohjaus: lisää ominaisuuksia ShowTextObjects, ShowImageObjects, ShowVectorObjects
- XMLExtractor lisää nyt tunnistetun tekstin "OCRConfidence" -määritteen
- PDF / A-tarkastustoiminto (beta)
- Parannetaan valvontaa ja tekstin tarkistamista ja yhdenmukaistamista alkuperäisen asettelun mukaisesti. Kysymys johtui Y-koordinaattien siirtämisestä hallintalaitteissa jäsentämisen aikana: se oli väärä. Oikea tapa on shif ...
- XML Extractor päivitetty: nyt tuottaa CONTROL-tunnistetta valintaruuduille ja tekstikentille
- muutettiin nykyisen hakemiston avulla temp-hakemistoon
- valintaruutuja, radiolaatikoita, muokkauslaatikoita, yhdistelmäobotteja tuetaan paremmin
- antaa nyt osittaisia luottamussoittoja
Uutta strong> versiossa 5.80.1781:
Versio 5.80.1781:
- PDF XML: ään, PDF: stä CSV: ään, PDF: stä tekstitoimintoihin päivitetty
- OCRMode tarjoaa nyt 9 tilaa
- .DetectLineInsteadOfParagraph nyt toimii paljon paremmin. Aseta se vääriksi kaapata monilinjaiset tekstit taulukon soluihin!
- PDF-hallintatuki parani
- FDF- ja XFDF-tietojen poisto
Uutta strong> versiossa 5.10.1747:
Versio 5.10.1747:
- PDF XML: ään, PDF: stä CSV: ään, PDF: n tekstitoimintoihin parannettu
- tukee tekstinpoistoa tekstinhallinnasta
- XML-erotin lisää fonttityyliä, kokoa, nimeä ja tekstikoordinaatteja tunnisteiksi
- Lisätty ASP.NET näyte OCR-käytölle
- uusi ominaisuus OCRLanguageDataFolder määrittää "tessdata" -kansion sijainnin
- parannettu PDF-tiedostojen tuki
- parantaa käännetyn tekstin tukea
- päivitetyt lähdekoodinäytteet
- päivitetty dokumentaatio
- pienet parannukset ja korjaukset
Uutta strong> versiossa 5.00.1626:
Versio 5.00.1626:
- OCR (tekstistä kuvista) -toiminto lisätty: nyt voit poimia tekstiä upotetuista kuvista ja korjata vioittuneen tekstin
- Kiinteä CSV- ja XML-poistoilmoitus puuttuu viimeisistä sarakkeista joidenkin asetusten kanssa
- Parannettu tuki vahingoittuneille PDF-tiedostoille
- Useita tekstinsyöttöhakemistoja on nyt tuettu
- voi nyt etsiä tekstiä yhdysmerkeillä ja eri riveillä: katso uusi lähdekoodin näyte Etsi teksti kahtena
- uusi ominaisuus .RTLTextAutoDetectionEnabled (oletuksena vääriä) autojen havaitsemiseen RTL-kielillä
- PDF-katseluohjelman käyttöliittymä on parantunut
- pienet parannukset ja korjaukset
Vaatimukset :
Vähimmäisvaatimukset strong>:
Nag-näyttö, vesileima lähtöön
Kommentteja ei löytynyt